Porque resolvi fazer estatística
Bom, eu estava lá feliz e contente (tá talvez não tão feliz assim) escrevendo um artigo na área de Ecologia do Fogo, como eu costumava fazer antes dos anos 2020. Acho que era esse artigo aqui, ou algum outro com germinação de sementes… Chega uma hora que parece que as ideias todas se misturam. Mas o ponto é, a primeira revista que enviamos recusou o trabalho, como é o costume com as primeiras revistas.
Um dos revisores desse periódico falou algo sobre a análise não estar adequada e fez algumas “sugestões”. Eu na altura não soube implementa-las (não sei se saberia hoje tampouco…). Bom, eu fiz o que qualquer pessoa normal faria nessa situação: vi se havia vagas abertas para portadores de diploma para uma segunda graduação. Em Estatística. E não é que por uma dádiva do destino, a chamada estava aberta e havia 10 vagas para portadores de diploma!
Inclusive, esse é um curso com uma densidade bem alta de pessoas já formaram em alguma coisa. Tenho colegas psicólogos, jornalistas, cientistas da computação, médicos, advogados…
Assim, comecei o curso no primeiro semestre de 2018. Bem na mesma época que eu também comecei a trabalhar na Secretaria de Saúde do DF.
Aprendendo a usar melhor o R
Quase todas as matérias da Estatística nós utilizamos o R. Algumas são específicas para aprender a programar melhor em R, como Computação Estatística (CE). Dessa nós fazemos duas: CE1, e adivinhem? CE 2. A primeira eu fiz com o Prof. Donald Pianto. Ele que me apresentou o tidyverse pela primeira vez. Eu simplesmente achei aquilo incrível. Nós seguimos a lógica do livro R4DS. Foi o primeiro contato que tive com RMarkdown, fiz os trabalhos com ele. Mas eu não sabia gerar os arquivos em PDF, nem usar HTML direito… então eu fazia em HTML e imprimia a página em PDF. Risos. Foi aí que consegui começar a analisar os dados da área de saúde.
Depois, no segundo semestre, tivemos a segunda parte da matéria com o Prof. Guilherme Souza. E aí foi a primeira vez que ouvi falar do GitHub, e que era possóvel também fazer apresentações no RStudio. O professor depois fez uma matéria optativa de CE3, para dados e cálculos massivos. Foi a oportunidade de aprender várias coisas que não vemos usualmente no curso: SQL, MongoDB, Spark, H20, computação em nuvem. Depois de ter sobrevivido às listas de exercícios super massivas (desculpa o trocadilho). Nessa matéria, eu e meus coleguinhas apresentamos um trabalho sobre o reticulate, para fazer a integração entre R e Python! Além disso foi a primeira vez que usamos o Quarto. E foi ótimo, que cada um usou sua IDE favorita: RStudio ou VSCode!
Os Slides estão aqui.
Apaixonada pelo Quarto, passei a utiliza-lo para todas as apresentações e produções de documentos daí por diante! Essa matéria também fizemos uma lista de exercício (bom, eu contribuí com o apoio moral praticamente) com o tema da copa do mundo. Claro, todos achávamos que o Brasil ia ganhar naquela época. O trabalho tinha o objetivo de fazer uma computação na nuvem, mas não conseguimos chegar nesse ponto… mas foi um exercício legal sobre Monte Carlo, assunto esse que eu so começaria a entender, na verdade, no semestre seguinte. Espero que o professor não se importe de eu parilhar a lista aqui (ou que pelo menos meus coleguinhas não achem e copiem…). Vou deixar meio escondido aqui.
No semestre seguinte, fiz mais uma matéria, agora de Estatística Computacional (sim, tem a Computação Estatística, e tem a Estatística Computacional). Dessa vez aprendemos mais coisas sobre simulação e geração de números aleatórios. Dessa eu não vou partilhar as listas não, a pedido do professor, mas a apresentação foi sobre o Stan. Ainda não tenho bem os conceitos sobre os princípios bayesianos completamente configurados na minha cabeça… mas me deu mo vontade de usar esse farramenta de verdade. Minha apresentação esta disponível aqui.
Esse semestre eu vou fazer uma matéria sobre Redes Neurais… e teoricamente o TCC nesse tema também. Vamos ver no que isso vai dar…

